پیمانه بندی هستان شناسی مبتنی بر گراف و مشابهت معنایی

thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی
author سودابه غفوریان
adviser محمود نقیب زاده محسن کاهانی
publication year 1392

abstract

پیمانه بندی هستان شناسی راهی مناسب برای استفاده از هستان شناسی های بزرگ است. برای ایجاد پیمانه هایی با کیفیت بالا، باید هم جنبه ساختاری و هم معنایی هستان شناسی در نظر گرفته شود. برای در نظر گرفتن ویژگی ساختاری هستان شناسی کافیست آن را به صورت گراف نمایش دهیم. برای در نظر گرفتن ویژگی معنایی هستان شناسی کافیست به روابط مختلف، وزنهای متفاوتی داده شود. وزندهی به یالها مستلزم شناسایی روابط مختلف و تشخیص میزان مهم بودن آنهاست. بنابراین برای انجام راه حل پیشنهادی گامهای ذیل طی میشود: 1. مشخص کردن نحوه نمایش گراف هستان شناسی از روشی برای نمایش گراف هستان شناسی استفاده میشود که فاعل، مفعول و فعل هر کدام جدا بهصورت گره در نظر گرفته میشوند. البته فقط خصوصیات objectproperty و datatypeproperty را گره در نظر میگیریم و بقیه روابط (خصوصیات) به صورت یال در نظر گرفته میشوند، به علاوه در این نمایش نمونه ها نیز به عنوان گره نمایش داده میشوند. 2. شناسایی روابط و وزندهی به آنها برای وزندهی به روابط مختلف هستان شناسی از یک تابع وزن استفاده میشود این تابع به بعضی از روابط موجود، عددی صحیح نسبت میدهد. وزن دادن یک راه تفاوت قائل شدن بین روابط است. یک راه اولویت دادن به روابط بر اساس پیدایش روابط است و راه دیگر این است که میتوان بر اساس معنا و تعریف روابط اولویت آنها را مشخص کرد. 3. یکسان سازی وزن یالها در صورت لزوم اگر بین گره ها بیش از یک رابطه وجود داشت بین وزن روابط حداکثر وزن در نظر گرفته میشود و سپس بر اساس وزن حداکثر و وزن یک گام بالاتر از این وزن در جدول 1، وزن حاصل به وزن یک گام بالاتر تنظیم میشود. 4. نرمالسازی برای نرمال سازی، وزن یال خروجی از گره مورد نظر بر مجموع وزنهای یالهای خروجی از گره تقسیم میشود. بنابراین وزنها بین صفر و 1 خواهند بود. خروجی این قسمت ماتریسی است که برای ورود به الگوریتم فاصله گام تصادفی آماده است. 5. تخمین نزدیکی رئوس با استفاده از الگوریتم همسایگی فاصله گام تصادفی از الگوریتم همسایگی فاصله گام تصادفی برای اندازه گیری نزدیکی رئوس هستان شناسی استفاده میشود. 6. پیمانه بندی تابع معیار استفاده شده silhouettes coefficient یا s(i) است. میانگین s(i) معیاری است که نشان میدهد چقدر داده ها در یک پیمانه، مناسب گروه بندی شده اند. s(i) را به ازای هر گره مفهوم با توجه به رابطه زیر به دست می آید. کارایی پیمانه بندی بر اساس متوسط امتیاز هر پیمانه به دست میآید. امتیاز هر پیمانه نیز بر اساس متوسط امتیازهای گره های داخل پیمانه یعنی s(i) ها محاسبه میشود. برای پیمانه بندی دو الگوریتم به شرح زیر پیشنهاد شده است: الگوریتم پیمانه بندی تجمعی ورودی الگوریتم تجمعی ماتریس همسایگی فاصله گام تصادفی است. این الگوریتم پیمانه را به صورت تکراری براساس داشتن شباهت زیاد با هم ادغام میکند. یک الگوریتم پایین به بالاست که در ابتدا هر راس را به عنوان یک پیمانه مجزا در نظر میگیرد و در آخر با یک گراف به عنوان یک پیمانه منحصربه فرد پایان میگیرد. در اینجا در هر مرحله به ازای هر دو پیمانه ci و cj، پیمانه ها باهم ادغام میشوند و امتیاز بدست میآید، ترکیبی که بیشترین امتیاز را دارد، لحاظ میشود و در آخر این ترکیب انتخاب شده و به مرحله بعد که یکی از تعداد پیمانه ها کم میشود، میرود و دوباره همین مراحل تکرار میشود تا در نهایت یک پیمانه باقی بماند. الگوریتم پیمانه بندی اکتشافی الگوریتم اکتشافی به منظور پیشتیبانی از هستان شناسی های بزرگ و کاهش زمان اجرا پیشنهاد شده است. ورودی این الگوریتم برای پیمانه بندی ماتریس وقوعی است که از روی ماتریس مجاورت ساخته شده است. هر سطر از ماتریس وقوع یک یال را معرفی میکند که شامل گره اول، گره دوم و وزن بین آن دو میشود. این ماتریس بر اساس ستون وزن به صورت صعودی مرتب میشود. الگوریتم بدین صورت است که اگر گره اول و دوم در یک پیمانه نباشند، باهم ادغام میشوند. سپس دو شرط چک میشود: اول، اگر اندازه پیمانه جدید کمتر از یک سوم کل تعداد گره ها باشد، ادغام صورت میگیرد و شرط دوم چک کردن امتیاز پیمانه بندی است که اگر امتیاز بالاتر باشد الگوریتم ادامه می یابد، در غیر اینصورت الگوریتم خاتمه می یابد. راهکار پیشنهادی هر دو جنبه ساختاری و معنایی هستان شناسی را در نظر می گیرد حال آن که در اکثر کارهای گذشته به هردو جنبه توجه نمیشود. معنا با توجه به اختصاص دادن وزن به روابط متفاوت در نظر گرفته شده است به علاوه نسبت به سایر رویکردها روابط بیشتری در نظر گرفته می شود. در نظر گرفتن روابط بیشتر باعث می شود که یالهای بیشتری در نمایش گراف هستان شناسی وجود داشته باشد که میتوان در پیدا کردن شباهت دو گره تصمیم بهتری گرفت. استفاده از ماتریس همسایگی فاصله گام تصادفی برای ترکیب جنبه ساختاری و معنایی هستان شناسی انجام می گیرد. هر درایه از این ماتریس با توجه به وزن تقریباً همه درایه های ماتریس احتمال انتقال محاسبه می شود بنابراین وزن ها در روش پیشنهادی دقیقتر از سایر روشهایی هستند که فقط از ماتریس وزن استفاده می کنند. به علاوه در روش پیشنهادی یک تابع امتیازدهی جدید معرفی شده است. هدف این تابع بیشینه کردن شباهت داخل پیمانه ها و کم کردن شباهت بین پیمانه هاست. تابع امتیازدهی با توجه به هدفش نشان میدهد که گره ها چقدر در داخل پیمانه مورد نظر مناسب گروه بندی شده اند. و در آخر به عنوان نتیجه میتوان گفت، پیمانه های ایجاد شده در روش ما دارای بار معنایی هستند زیرا در این پژوهش روابط بیشتری نسبت به روشهای مشابه در نظر گرفته میشود و این روابط طوری پردازش میشوند که وزن هر یال یا رابطه روی انتخاب هر پیمانه تاثیر میگذارد.

similar resources

بررسی هستان شناسی های توسعه یافته مبتنی بر اصول هستان شناسی های منبع باز زیست پزشکی

Background and Aim: Ontologies facilitate data integration, exchange, searching and querying. Open Biomedical Ontologies (OBO) Foundry is a solution for creating reference ontologies. In this foundry, the design of ontologies is based on established principles which allow for their interactions as a single system. The purpose of this study is to determine the main features of ontologies develop...

full text

تعیین مشابهت معنایی به روش بدون‌سرپرست با استفاده از قدم‌زنی تصادفی بر گراف جایگزینی زبانی

این مقاله به معرفی روشی برای تعیین مشابهت معنایی کلمات با استفاده از پیکره‌های تنک می‌پردازد. این روش با ارائه مفهوم جایگزین‌پذیری غیرمستقیم برای اولین بار و پیاده‌سازی آن از طریق گراف جایگزین‌پذیری عبارت‌ها توانسته است بر مشکل تنک بودن فضای زمینه در زبان‌های با منابع محدودتر مانند فارسی غلبه نماید. از طرف دیگر باید به این نکته اشاره نمود که برای تولید گراف جایگزینی لازم برای تعیین مشابهت معنای...

full text

یک الگوریتم مبتنی بر owl dl برای محاسبه فاصله معنایی مفاهیم در یک هستان شناسی

اندازه گیری میزان شباهت معنایی بین مفاهیم بر اساس توصیفات آن ها در هستان شناسی ، عملیاتی بنیادی در بازیابی اطلاعات ، بازیابی مولفه ها و کشف سرویس ها محسوب می شود . در این موارد نیاز داریم که میزان شباهت یا میزان مطابقت دو توصیف یا مستند و یا میزان مطابقت چند کلمه کلیدی با محتوای یک توصیف یا مستند را تعیین نماییم . درنهایت این مسئله ، به مسئله تعیین میزان شباهت بین دو کلمه و یا دو مفهوم ، تبدیل ...

15 صفحه اول

رتبه بندی رأس‌های گراف

یک مسئلۀ مهم در نظریۀ گراف، علوم کامپیوتر و شبکه های اجتماعی، مشخص کردن اهمیت رأس های یک گراف (یا گره های یک شبکه) است. بدین منظور، معیارها و روش های گوناگونی پیشنهاد شده است. یکی از این روش ها، رتبه بندی است که بر پایۀ گا م برداریِ تصادفی بنا شده است. هدف ما در این مقاله، توضیح الگوریتم رتبه بندی به دو شکل متمرکز و توزیع شده است. به این منظور، نخست مفهوم رتبه بندی و الگوریتم محاسبۀ آن را به صور...

full text

ارزیابی روش های ساخت اتوماتیک هستان شناسی وب معنایی

رشد بی رویه داده های روی وب اداره و کاوش اطلاعات را مشکل می سازد. هدف وب معنایی آن است که پایگاه دانش معنایی را به صفحات وب که شامل ابرمتون زبان طبیعی می باشند، اضافه نماید، تا قدرت جستجوی عمیق و جامعیت اطلاعات را بوجود آورد. از آنجا که ساخت یک پایگاه داده و هستان شناسی بصورت دستی بسیار هزینه بر و زمان گیر است، مانعی بر سر راه پیشرفت فعالیت های وب معنایی می باشد. به همین دلیل محققین سعی دارند ب...

15 صفحه اول

ترکیب خودکار سرویس‌ها مبتنی بر گراف رنگ‌آمیزی

سرویس‌های وب به‌عنوان مؤلفه‌های نرم‌افزاری مستقل توسط ارائه‌دهندگان سرویس بر روی اینترنت منتشر شده و توسط درخواست‌کنندگان سرویس برای رسیدن به اهداف مختلف فراخوانی می‌شوند. با این حال در بسیاری از موارد هیچ سرویسی به‌تنهایی در مخزن سرویس یافت نمی‌شود که بتواند رضایت درخواست‌کننده را برآورده سازد. ترکیب سرویس، مؤلفه‌های جدیدی را با استفاده از یک مدل تعاملی برای سرعت بخشیدن به برنامه‌ها ایجاد می‌ک...

full text

My Resources

Save resource for easier access later

Save to my library Already added to my library

{@ msg_add @}

document type: thesis

وزارت علوم، تحقیقات و فناوری - دانشگاه فردوسی مشهد - دانشکده مهندسی

Keywords

پیمانه بندی هستان شناسی استفاده مجدد از هستان شناسی مشابهت معنایی

Hosted on Doprax cloud platform doprax.com